让AI学习效率飙升50倍的秘密:在线策略蒸馏
于是你换了种方法。让他自己写,然后你在旁边指出每一个句子的优劣、逻辑是否通顺、语气是否合适。
学习 策略 th thinkingmachines rlhf 2025-10-29 12:12 2
于是你换了种方法。让他自己写,然后你在旁边指出每一个句子的优劣、逻辑是否通顺、语气是否合适。
学习 策略 th thinkingmachines rlhf 2025-10-29 12:12 2
一个月前,我们曾报道过清华姚班校友、普林斯顿教授陈丹琦似乎加入 Thinking Machines Lab的消息。有些爆料认为她在休假一年后,会离开普林斯顿,全职加入 Thinking Machines Lab。
导读易彤老师是中国电信人工智能研究院算语义算法工程师。她深度参与了 telechat 大模型通用 Chat 能力的研发,以及后训练的一些优化的工作。本次演讲介绍如何去提升 LLM 基础的 Function Call 能力,系统性的阐述从数据维度及训练维度两个方
前两年,大模型火得不讲道理。从GPT-3到GPT-4,参数越堆越多,新闻也越看越玄,但真到产品经理这里,问题从来不是“这模型厉不厉害”,而是“我怎么用它干点实事”。
这几年,AI大模型的崛起几乎成了科技圈的年度大戏。它们像是一块块潜力无穷的“原石”,在不断被打磨,逐渐从“通用大脑”走向更加精细、实用的工具。而作为产品经理,如果光是知道模型算力堆得多高、参数多大,仍然会觉得“我有点跟不上节奏”。真正关键的问题是:我们如何利用
AI对齐是将目标以及人类价值观编码到AI模型中的技术过程,使其变得可靠、安全并最终有用。这里至少有两个重要挑战需要考虑。从伦理和道德角度来看,谁来决定什么是可接受的,什么是好的或坏的?从更实际的技术角度来看,问题是如何将这些价值观和目标的编码实施到AI系统中。
AI顶流Claude升级了,程序员看了都沉默:不仅能写代码能力更强了,还能连续干活7小时不出大差错!AGI真要来了?这背后到底发生了什么?现在,还有机会加入AI行业吗?如今做哪些准备,才能在未来立足?